1. Identificação | |
Tipo de Referência | Tese ou Dissertação (Thesis) |
Site | mtc-m21c.sid.inpe.br |
Código do Detentor | isadg {BR SPINPE} ibi 8JMKD3MGPCW/3DT298S |
Identificador | 8JMKD3MGP3W34R/43RU675 |
Repositório | sid.inpe.br/mtc-m21c/2020/12.28.13.44 |
Última Atualização | 2021:05.03.15.44.27 (UTC) simone |
Repositório de Metadados | sid.inpe.br/mtc-m21c/2020/12.28.13.44.06 |
Última Atualização dos Metadados | 2022:04.03.23.15.39 (UTC) administrator |
Chave Secundária | INPE-18388-TDI/3046 |
Chave de Citação | Carvalho:2021:NeAlPo |
Título | Bisecting stochastic clustering: a new algorithm for PolSAR image unsupervised classification |
Título Alternativo | Bi-divisão estocástica de agrupamento: um novo algoritmo para classificação não supervisionada de imagens polSAR |
Curso | CAP-COMP-DIPGR-INPE-MCTI-GOV-BR |
Ano | 2021 |
Data | 2020-11-10 |
Data de Acesso | 06 maio 2024 |
Tipo da Tese | Tese (Doutorado em Computação Aplicada) |
Tipo Secundário | TDI |
Número de Páginas | 179 |
Número de Arquivos | 1 |
Tamanho | 22833 KiB |
|
2. Contextualização | |
Autor | Carvalho, Naiallen Carolyne Rodrigues Lima |
Banca | Körting, Thales Sehn (presidente) Sant'Anna, Sidnei João Siqueira (orientador) Bins, Leonardo Sant'Anna (orientador) Shiguemori, Elcio Hideiti Carvalho, Solon Venâncio de Correia, Antonio Henrique Sousa Júnior, Manoel de Araújo |
Endereço de e-Mail | naiallen@yahoo.com.br |
Universidade | Instituto Nacional de Pesquisas Espaciais (INPE) |
Cidade | São José dos Campos |
Histórico (UTC) | 2020-12-28 14:26:50 :: naiallen.carvalho@inpe.br -> administrator :: 2021-01-08 15:16:45 :: administrator -> simone :: 2021-04-29 17:26:46 :: simone :: -> 2020 2021-04-29 17:30:23 :: simone -> administrator :: 2020 2021-04-30 07:21:03 :: administrator -> simone :: 2020 2021-04-30 18:58:20 :: simone :: 2020 -> 2021 2021-05-04 14:19:04 :: simone -> administrator :: 2021 2022-04-03 23:15:39 :: administrator -> :: 2021 |
|
3. Conteúdo e estrutura | |
É a matriz ou uma cópia? | é a matriz |
Estágio do Conteúdo | concluido |
Transferível | 1 |
Palavras-Chave | stochastic distance Riemann geometry divisive hierarchical clustering PolSAR image unsupervised classification distancia estocastica geometria de Riemann agrupamento divisivo hierarquico imagens PolSAR classificação não supervisionada |
Resumo | PolSAR (Polarimetric Synthetic Aperture Radar) images can be represented by a set of complex Hermitian positive definite matrices, which have a natural Riemannian metric tensor. PolSAR images are, also, known for following the Wishart distribution, and, by using the information theory contrast function, stochastic distances between Wishart distributions can be derived. This work addresses unsupervised classification strategies, explores the Riemann geometry and studies stochastic distances applied to PolSAR images. The proposed algorithm, named Bisecting Stochastic Clustering (BSC), is a combination between the Stochastic Clustering (SC) algorithm and the hierarchical divisive clustering algorithm. The SC algorithm is technique based on K-means, which uses stochastic distances as similarity metric. The SC algorithm can, usually, be trapped in a local minimum, what led to incorrect clustering results. Therefore, the choice of good initial parameter candidates is essential for the clustering quality. The BSC algorithm is a top-down procedure, it starts with all samples in an unique cluster, that are successively splitted into two new sub-clusters. This algorithm is mainly divided into three steps: the initial parameter determination, the cluster bi-partitioning procedure, and the choice of a suitable cluster to split. In this work, two algorithms for the initial parameter determination are tested: the Expectation-Maximization (EM) algorithm for Wishart Mixture Model and the Riemann Principal Direction Divisive Partitioning (RPDDP). The RPDDP is a new proposed algorithm, whose goal is to perform the bi-partition of a dataset. This algorithm estimates the dataset covariance matrix under the the Riemann geometry, in order to find the principal component, which is used to separate the input data in two sub-clusters. From the RPDDP two estimated sub-clusters, the BSC derives the initial parameters. The BSC second step is performed by the SC algorithm. The BSC builds a dendrogram in order to represent the dataset splitting. Each sub-cluster, or node, links two successor sub-clusters in the dendrogram. When three or more nodes are available in one dendrogram level, the algorithm needs to choose a node to split. The BSC third step uses the information gain as the node choice rule. This work analyses the SC algorithm and two main variants of BSC. The first variant uses the RPDDP as initial parameter determiner, and the second, uses the EM algorithm as initial parameter determiner. The Bhattacharyya (B), Kullback-Leibler (KL) and Hellinger (H) stochastic distances are analysed in this work. In total, nine algorithms are evaluated: SC-B, SC-KL, SC-H, BSC-R-B, BSC-R-KL, BSC-R-H, BSC-EM-B, BSC-EM-KL, BSC-EM-H. The algorithms were analysed in a quantitative and qualitative way. The quantitative analysis consists in the confusion matrix and accuracy estimation, and the qualitative analysis explore the BSC dendrogram and the clusters scattering mechanism by inspecting the Plan H − alpha. RESUMO: As imagens PolSAR (Polarimetric Synthetic Aperture Radar) podem ser representadas por um conjunto de matrizes definidas positivas Hermitianas complexas, que possuem um tensor métrico Riemanniano. As imagens PolSAR também são conhecidas por seguir a distribuição de Wishart e, usando a função de contraste da teoria da informação, distâncias estocásticas entre as distribuições de Wishart podem ser derivadas. Este trabalho aborda estratégias de classificação não supervisionadas, explora a geometria de Riemann e estuda distâncias estocásticas aplicadas às imagens PolSAR. O algoritmo proposto, denominado Bisecting Stochastic Clustering (BSC), é uma combinação entre o algoritmo Stochastic Clustering (SC) e o algoritmo hierárquico divisivo. O algoritmo SC é uma técnica baseada no K-médias, que usa distâncias estocásticas como métrica de similaridade. O algoritmo SC pode, geralmente, ficar preso em um mínimo local, o que leva a agrupamentos incorretos. Por isso, a escolha de bons parâmetros iniciais é essencial para a qualidade do agrupamento. O algoritmo BSC é um procedimento top-down, ele começa com todas as amostras em um único cluster, que é sucessivamente dividido em dois novos subclusters. Este algoritmo é dividido em três etapas: a determinação do parâmetro inicial, o procedimento de bi-particionamento do cluster e a escolha de um cluster adequado para dividir. Neste trabalho, dois algoritmos para a determinação dos parâmetros iniciais são testados: o algoritmo Expectation-Maximization (EM) para o Modelo de Mistura de Wishart e o Particionamento Divisivo da Direção Principal de Riemann (RPDDP). O RPDDP é um novo algoritmo, proposto com objetivo de realizar a bi-partição de um conjunto de dados. Este algoritmo estima a matriz de covariância do conjunto de dados sob a geometria de Riemann, a fim de encontrar a componente principal, que é usada para separar os dados de entrada em dois subclusters. A partir dos dois subclusters estimados pelo RPDDP, o BSC deriva os parâmetros iniciais. A segunda etapa do BSC é realizada pelo algoritmo SC. O BSC constrói um dendrograma para representar a divisão do conjunto de dados. Cada sub-cluster, ou nó, é ligado a dois sub-grupos sucessores no dendrograma. Quando há três ou mais nós disponíveis em um nível de dendrograma, o algoritmo precisa escolher um nó para ser dividido. A terceira etapa do BSC usa o ganho de informação como regra de escolha desse nó. Este trabalho analisa o algoritmo SC e as duas variantes principais do BSC. A primeira variante usa o RPDDP como determinador dos parâmetros iniciais e a segunda, usa o algoritmo EM. As distâncias estocásticas de Bhattacharyya (B), Kullback-Leibler (KL) e Hellinger (H) são analisadas neste trabalho. No total, nove algoritmos são avaliados: SC-B, SC-KL, SC-H, BSC-R-B, BSC-R-KL, BSC-RH, BSC-EM-B, BSC-EM-KL, BSC-EM-H. Os algoritmos foram analisados de forma quantitativa e qualitativa. A análise quantitativa consiste no calculo da matriz de confusão e na estimativa da acuracia; a análise qualitativa explora o dendrograma e os mecanismos de espalhamento dos clusters através da inspeção do Plan H− alpha. |
Área | COMP |
Arranjo 1 | urlib.net > BDMCI > Fonds > Produção pgr ATUAIS > CAP > Bisecting stochastic clustering:... |
Arranjo 2 | urlib.net > BDMCI > Fonds > Produção a partir de 2021 > CGIP > Bisecting stochastic clustering:... |
Conteúdo da Pasta doc | acessar |
Conteúdo da Pasta source | originais/@4primeirasPaginas.pdf | 03/05/2021 12:41 | 413.0 KiB | originais/ambiente_latex_no_linux.pdf | 28/12/2020 13:52 | 21.7 MiB | originais/aprovacao.pdf | 17/11/2020 07:19 | 314.4 KiB | |
Conteúdo da Pasta agreement | |
|
4. Condições de acesso e uso | |
URL dos dados | http://mtc-m21c.sid.inpe.br/ibi/8JMKD3MGP3W34R/43RU675 |
URL dos dados zipados | http://mtc-m21c.sid.inpe.br/zip/8JMKD3MGP3W34R/43RU675 |
Idioma | en |
Arquivo Alvo | publicacao.pdf |
Grupo de Usuários | naiallen.carvalho@inpe.br |
Visibilidade | shown |
Licença de Direitos Autorais | urlib.net/www/2012/11.12.15.10 |
Detentor dos Direitos | originalauthor yes |
Permissão de Leitura | allow from all |
Permissão de Atualização | não transferida |
|
5. Fontes relacionadas | |
Repositório Espelho | urlib.net/www/2017/11.22.19.04.03 |
Unidades Imediatamente Superiores | 8JMKD3MGPCW/3F2PHGS 8JMKD3MGPCW/46KUES5 |
Acervo Hospedeiro | urlib.net/www/2017/11.22.19.04 |
|
6. Notas | |
Campos Vazios | academicdepartment affiliation archivingpolicy archivist callnumber contenttype copyholder creatorhistory descriptionlevel dissemination doi electronicmailaddress format group isbn issn label lineage mark nextedition notes number orcid parameterlist parentrepositories previousedition previouslowerunit progress readergroup resumeid schedulinginformation secondarydate secondarymark session shorttitle sponsor subject tertiarymark tertiarytype url versiontype |
|